智能论文笔记

LIDL: Local Intrinsic Dimension Estimation Using Approximate Likelihood

Piotr Tempczyk , Rafał Michaluk , Łukasz Garncarek , Przemysław Spurek , Jacek Tabor , Adam Goliński

分类： (统计)机器学习 | 机器学习

2022-06-29

估计数据分布的局部内在维度的大多数现有方法不能很好地扩展到高维数据。他们中的许多人依靠非参数最近的邻居方法，该方法受到维度的诅咒。我们试图通过提出一种新的问题来解决这一挑战：使用近似可能性（LIDL）的局部固有维度估计。我们的方法依赖于任意密度估计方法作为其子例程，因此通过利用最新的参数神经方法的进展来避免维度挑战，以进行可能性估计。我们仔细研究了所提出方法的经验特性，将其与我们的理论预测进行了比较，并表明LIDL在此问题的标准基准上产生竞争结果，并将其扩展到数千个维度。更重要的是，我们预计通过密度估计文献的持续进展，这种方法可以进一步改善。

translated by 谷歌翻译

Bounding Evidence and Estimating Log-Likelihood in VAE

Łukasz Struski , Marcin Mazur , Paweł Batorski , Przemysław Spurek , Jacek Tabor

分类：机器学习 | 人工智能 | (统计)机器学习

2022-06-19

深度学习和统计数据中的许多关键问题是由变异差距引起的，即证据和证据下限（ELBO）之间的差异。结果，在经典的VAE模型中，我们仅获得对数可能的下限，因为Elbo被用作成本函数，因此我们无法比较模型之间的对数可能性。在本文中，我们提出了变化差距的一般有效的上限，这使我们能够有效估计真实的证据。我们提供了对拟议方法的广泛理论研究。此外，我们表明，通过应用我们的估计，我们可以轻松地获得VAE模型的对数模型的下限和上限。

translated by 谷歌翻译

Continual Learning with Guarantees via Weight Interval Constraints

Maciej Wołczyk , Karol J. Piczak , Bartosz Wójcik , Łukasz Pustelnik , Paweł Morawiecki , Jacek Tabor , Tomasz Trzciński , Przemysław Spurek

分类：机器学习

2022-06-16

我们引入了一个新的培训范式，该范围对神经网络参数空间进行间隔约束以控制遗忘。当代持续学习（CL）方法从一系列数据流有效地培训神经网络，同时减少灾难性遗忘的负面影响，但它们不能提供任何确保的确保网络性能不会随着时间的流逝而无法控制地恶化。在这项工作中，我们展示了如何通过将模型的持续学习作为其参数空间的持续收缩来遗忘。为此，我们提出了Hypertrectangle训练，这是一种新的训练方法，其中每个任务都由参数空间中的超矩形表示，完全包含在先前任务的超矩形中。这种配方将NP-HARD CL问题降低到多项式时间，同时提供了完全防止遗忘的弹性。我们通过开发Intercontinet（间隔持续学习）算法来验证我们的主张，该算法利用间隔算术来有效地将参数区域建模为高矩形。通过实验结果，我们表明我们的方法在不连续的学习设置中表现良好，而无需存储以前的任务中的数据。

translated by 谷歌翻译

Target Layer Regularization for Continual Learning Using Cramer-Wold Generator

Marcin Mazur , Łukasz Pustelnik , Szymon Knop , Patryk Pagacz , Przemysław Spurek

分类：机器学习 | 人工智能 | 计算机视觉

2021-11-15

我们提出了一种有效的正则化战略（CW-TALAR），用于解决持续的学习问题。它使用由在由所有任务共享的底层神经网络的目标层上定义的两个概率分布之间的校准术语，该概率分布在由所有任务共享的底层神经网络的目标层，以及用于建模输出数据表示的克拉米 - WOLD发生器的简单架构。我们的策略在学习新任务时保留了目标层分发，但不需要记住以前的任务的数据集。我们执行涉及几个常见监督框架的实验，该框架证明了CW-TALAR方法的竞争力与一些现有的现有最先进的持续学习模型相比。

translated by 谷歌翻译

Climate Policy Tracker: Pipeline for automated analysis of public climate policies

Artur Żółkowski , Mateusz Krzyziński , Piotr Wilczyński , Stanisław Giziński , Emilia Wiśnios , Bartosz Pieliński , Julian Sienkiewicz , Przemysław Biecek

分类：自然语言处理

2022-11-10

The number of standardized policy documents regarding climate policy and their publication frequency is significantly increasing. The documents are long and tedious for manual analysis, especially for policy experts, lawmakers, and citizens who lack access or domain expertise to utilize data analytics tools. Potential consequences of such a situation include reduced citizen governance and involvement in climate policies and an overall surge in analytics costs, rendering less accessibility for the public. In this work, we use a Latent Dirichlet Allocation-based pipeline for the automatic summarization and analysis of 10-years of national energy and climate plans (NECPs) for the period from 2021 to 2030, established by 27 Member States of the European Union. We focus on analyzing policy framing, the language used to describe specific issues, to detect essential nuances in the way governments frame their climate policies and achieve climate goals. The methods leverage topic modeling and clustering for the comparative analysis of policy documents across different countries. It allows for easier integration in potential user-friendly applications for the development of theories and processes of climate policy. This would further lead to better citizen governance and engagement over climate policies and public policy research.

translated by 谷歌翻译

SurvSHAP(t): Time-dependent explanations of machine learning survival models

Mateusz Krzyziński , Mikołaj Spytek , Hubert Baniecki , Przemysław Biecek

分类：机器学习 | 人工智能 | (统计)机器学习

2022-08-23

与经典的统计学习方法相比，机器和深度学习生存模型表现出相似甚至改进事件的预测能力，但太复杂了，无法被人类解释。有几种模型不合时宜的解释可以克服这个问题。但是，没有一个直接解释生存函数预测。在本文中，我们介绍了Survhap（t），这是第一个允许解释生存黑盒模型的解释。它基于Shapley添加性解释，其理论基础稳定，并在机器学习从业人员中广泛采用。拟议的方法旨在增强精确诊断和支持领域的专家做出决策。关于合成和医学数据的实验证实，survhap（t）可以检测具有时间依赖性效果的变量，并且其聚集是对变量对预测的重要性的决定因素，而不是存活。 survhap（t）是模型不可屈服的，可以应用于具有功能输出的所有型号。我们在http://github.com/mi2datalab/survshap中提供了python中时间相关解释的可访问实现。

translated by 谷歌翻译

Seminaive Materialisation in DatalogMTL

Dingmin Wang , Przemysław Andrzej Wałęga , Bernardo Cuenca Grau

分类：人工智能

2022-08-15

DatalOgMTL是与公制临时运算符的DataLog扩展程序，该临时操作员在基于时间本体的数据访问和查询答案以及流推理中找到了应用程序。DatalOgMTL的实用算法依赖于基于实质化的推理，在这些推理中，在连续的规则应用程序中以前向链接方式得出时间事实。但是，基于当前的基于物质化的程序是基于幼稚的评估策略，其中主要效率的主要来源源于冗余计算。在本文中，我们提出了一个基于物质化的过程，该过程类似于数据编号中的经典半算法，旨在通过确保在执行算法期间最多一次考虑每一个时间规则实例，以最大程度地减少冗余计算。我们的实验表明，我们针对DatalOgMTL的优化半策略能够显着减少实质化时间。

translated by 谷歌翻译

Virtual Reality Simulator for Fetoscopic Spina Bifida Repair Surgery

Przemysław Korzeniowski , Szymon Płotka , Robert Brawura-Biskupski-Samaha , Arkadiusz Sitek

分类：计算机视觉 | 机器人

2022-07-30

脊柱裂（SB）是在妊娠早期阶段出现的出生缺陷，脊髓周围的脊柱闭合不完全。对仍在怀孕子宫中的胎儿进行的对胎儿镜脊柱叶片修复的兴趣日益增加，这促使需要进行适当的训练。此类过程的学习曲线非常陡峭，需要出色的程序技能。基于计算机的虚拟现实（VR）模拟系统提供了一个安全，成本效益且可配置的培训环境，而没有道德和患者安全问题。但是，据我们所知，目前尚无用于胎儿镜SB修复程序的商业或实验VR培训模拟系统。在本文中，我们为SB-Repair的核心手动技能培训提供了新颖的VR模拟器。通过获得14位临床医生的主观反馈（面部和内容有效性），进行了初始的模拟现实主义验证研究。总体模拟现实主义平均在5分李克特量表上标记为4.07（1-非常不现实，5-非常现实）。它作为SB-REPAIR以及学习基本腹腔镜技能的有用性分别标记为4.63和4.80。这些结果表明，胎儿镜手术的VR模拟可能会导致外科训练，而不会使胎儿及其母亲处于危险之中。它还可以促进更广泛的胎儿镜手术适应，以代替更具侵入性的开放性胎儿手术。

translated by 谷歌翻译

Selectively increasing the diversity of GAN-generated samples

Jan Dubiński , Kamil Deja , Sandro Wenzel , Przemysław Rokita , Tomasz Trzciński

分类：计算机视觉 | 机器学习

2022-07-04

生成对抗网络（GAN）是能够合成数据样本的强大模型，与真实数据的分布非常相似，但是由于所谓的模式崩溃现象在gans中观察到了这些生成样品的多样性受到限制。尤其容易崩溃的是有条件的gan，它们倾向于忽略输入噪声矢量并专注于条件信息。提议减轻这种限制的最新方法增加了生成的样品的多样性，但是当需要样品相似性时，它们会降低模型的性能。为了解决这一缺点，我们提出了一种新颖的方法，可以选择性地增加GAN生成样品的多样性。通过在训练损失功能中添加简单但有效的正则化，我们鼓励发电机发现与不同输出相关的输入的新数据模式，同时为其余的输出生成一致的样本。更确切地说，我们最大化生成的图像与输入潜在向量之间的距离之比，根据给定条件输入的样品的多样性缩放效果。我们在合成基准测试中显示了我们方法的优势，以及在CERN LHC的Alice实验零度量热计中模拟数据的现实情况。

translated by 谷歌翻译

Explainable expected goal models for performance analysis in football analytics

Mustafa Cavus , Przemysław Biecek

分类：机器学习

2022-06-14

预期的目标提供了对球队和球员表现的更具代表性的衡量标准，这也适合足球的低分性质，而不是现代足球比赛。比赛的得分涉及随机性，并且通常不能代表球队和球员的表现，因此近年来使用替代统计数据（例如目标，球控球和钻探）是很受欢迎的。为了衡量射击的可能性是预期目标的目标，使用了一些功能来训练基于事件并跟踪足球数据的预期目标模型。这些功能的选择，数据的大小和日期以及可能影响模型性能的参数。使用黑框机器学习模型来提高模型的预测性能，可降低其可解释性，从而导致可以从模型中收集的信息丢失。本文提出了一个准确的预期目标模型，该模型由2014 - 15年至2020 - 21年欧洲前五名的欧洲足球联赛的七个赛季中的315,430张训练。此外，通过使用可解释的人工智能工具来获取可解释的预期目标模型来评估团队或球员性能。据我们所知，这是第一篇论文，该论文展示了可解释的人工智能工具汇总配置文件的实际应用，以解释一组观察结果，以进行准确的预期目标模型，以监视团队和球员绩效。此外，这些方法可以推广到其他运动分支。

translated by 谷歌翻译